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摘要 : 负荷 预测 能 有 效 助力 负荷 供需 的 动态 平衡 , 保障 电力 系统 稳定 运行 。 基 于 统计 模型 和 基于 深度 学 习 是 
目前 构建 预测 方法 的 两 种 思路 ， 但 是 少 有 从 可 解释 的 角度 构建 负荷 预测 方法 。 本 文 利用 深度 神经 网 络 的 非 
线性 拟 合 能 力 ， 以 及 指数 平滑 模型 的 可 解释 特性 ， 提 出 了 深度 平滑 因子 模型 (DeepES) 。 从 实际 负荷 序列 
数据 中 的 预测 结果 来 看 ，DeepES 模 型 实现 了 最 优 的 预测 效果 ， 而 且 相 比 于 传统 单一 因子 作为 网 络 输入 的 
RNNs 网 络 具有 更 精确 、 可 解释 性 更 好 的 负荷 预测 模型 。 


关键 词 : 负荷 预测 ; 深度 神经 网 络 ， 可 解释 网 络 ， 指 数 平滑 模型 ; 


Power load forecasting based on interpretable networks 
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Abstract: Load forecasting can effectively balance the load at both ends of supply and demand. Statistical model and 
deep learning are two common ways of constructing forecasting methods, but few load forecasting methods are 
constructed from the perspective of explanation. In this paper, a deep smoothing factor model, termed as DeepES, is 
proposed based on the nonlinear fitting ability of deep neural network and the explicable property of exponential 
smoothing model. According to the experimental results using actual load series data, the DeepES model achieves the 
best prediction. Moreover, compared with the traditional RNNs network with a single factor as the network input, 
DeepES has a more accurate and better explanatory for load prediction. 
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0 3 引言 可 以 分 为 两 大 类 ,一 是 基于 统计 模型 的 负荷 预测 方法 ， 
这 类 方法 基于 数学 、 统 计 理 论 构建 ， 具 有 很 好 的 可 解 
由 于 电能 的 特点 是 即 发 即 用 ， 因 此 提前 对 负荷 进 释 性 。 第 见 的 有 自 回归 移动 平均 (Auto Regression 
行 预测 可 以 有 效 地 进行 能 源 管理 ， 实 现 负荷 供需 的 动 Moving Average, ARMA)、 自 回归 (Auto Regression, AR) 
态 平衡 , 保障 电力 系统 的 稳定 运行 山 。 双 碳 背 景 下 , 新 等 时 间 序 列 模型 外 51。 此外, 也 有 基于 卡尔 曼 滤 波 的 
能 源 入 网 的 比例 逐渐 提供 , 电动 汽车 的 数量 日 益 增 加 ， 预测 方法 I， 基于 指数 平滑 度 预测 方法 外 。 另 一 类 就 
这 些 因素 增加 了 电网 负 蓓 的 波动 性 ， 也 给 准确 预测 用 是 基于 神经 网 络 的 预测 方法 ， 这 是 目前 主流 的 预测 方 
负荷 带 来 了 挑战 中 由。 法 外 90。 其 中 以 长 短期 记忆 网 络 LSTM (Long Short- 
从 模型 可 解释 的 角度 来 看 ， 现 有 的 负荷 预测 方法 Term Memory, LSTM) 和 门 控 循环 单元 (Gate Recurrent 


Unit GRU ) 为 主 的 循环 神经 网 络 (Recurrent Neural ”年 用 经 验 数据 测试 了 Holt 的 方法 ， 这 些 方 法 被 称 为 
Network, RNN) 在 负荷 预测 中 有 广泛 应 用 DO0203。 比 ”Holt-Winters 预测 系统 。 现 有 的 指数 平滑 方法 均 是 对 这 
如 ， 文 献 [14] 基 于 长 短期 记忆 网 络 提出 了 一 种 针对 区 三 位 学 者 提出 方法 的 扩展 。 表 1 给 出 了 常用 的 几 种 三 
域 级 负荷 的 深度 超 短 期 预测 方法 。 也 有 很 多 学 者 将 循 。 ”次 指数 平滑 。 预 测 原 理 是 平滑 因子 、 趋 势 因 
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环 神经 网 络 与 其 他 方法 相 结 合 实现 负荷 预测 。 此 外 ， 因子 三 种 因子 的 线性 组 合 。 
Transformer 模型 仅 两 年 在 预测 任务 中 得 到 了 很 广泛 表 1 常用 指数 平滑 方法 
的 应 用 503。 比如 ， 文 献 [16] 基 于 Transformer 设计 了 一 Tab.1 Common exponential smoothing methods 
种 适应 于 长 期 时 间 序 列 预测 (LSTF) 的 高 效 的 结构 ,可 道夫 于 由 ek 
以 实现 负荷 数据 的 长 时 预测 ER 
总 的 来 说 ， 基 于 统计 模型 的 预测 方法 ， 其 特点 是 ee Ti=pBG-ID+G-P)T， 
可 解释 性 强 , 但 是 效果 没有 基于 神经 网 络 的 好 。 相 反 ， Si=y CD)+(1-) Six (1) 
由 于 神经 网 络 本 身 是 一 个 黑 盒 ， 在 网 络 中 ， 很 难 厘 清 Xi lithTitSi er 
模型 对 负 蓓 序列 特征 的 提取 过 程 I209。 但是， 神经 网 1a(x/SiD)+(1-0) (T+Ti) 
络 模型 具有 很 强 的 非 线性 映射 能 力 ， 能 够 实现 效果 不 。 AM J 2 
Si=Y(xi/L)+(1-y)Six 2) 
错 的 负荷 预测 。 模 型 可 解释 性 是 神经 网 络 的 主要 缺点 ， ee 
构建 具有 可 解释 性 的 且 预 测 效 果 好 的 模型 受到 了 学 者 
们 的 关注 。 在 负荷 预测 中 ， 构 建 具有 可 解释 性 的 预测 0 
RE 这 PDTL-D 
模型 ， 能 够 让 用 户 理解 模型 的 推理 过 程 ， 有 助 于 增加 。 MA es G) 
对 模型 的 可 信 度 。 xitp=LTh+Si kh 
因此 ， 本 文 综合 神经 网 络 模型 和 统计 模型 的 优点 a T=Q (xX;/Six)+(1-o TT 
以 指数 平滑 模型 为 基础 创新 地 设计 了 具有 可 解释 性 的 、 TB D+(1-B) Ti 测 
循环 神经 网 络 DeepES (Deep Exponential Smoothing ) 。 | SY(CXi/ WD 
数 平滑 模型 0， 能 够 通过 特定 参数 明确 地 描述 输入 人 
序列 的 周期 性 、 趋 势 性 和 平滑 性 。 描 述 负荷 序列 的 特 ROW 
征 ， 但 是 如 何以 此 为 基础 构建 循环 神经 网 络 需要 解决 ee 


一 下 问题 (1) 指数 平滑 模型 中 的 因子 ( 即 平滑 因子 、 。 2 DeepES 模型 

趋势 因子 和 季节 因子 ) 是 迭代 计算 的 ， 因 此 如 何 设计 > 

神经 网 络 实现 这 些 因 子 的 迭代 计算 是 必须 解决 的 问题 ， et hd i i 
O 〇 。” (2) 这 些 因子 之 间 也 有 相关 性 , 在 神经 网 络 中 如 何 表 ”了 的 组 合 实现 预测 。 如 表 1 所 示 ， 这 些 公式 中 三 种 因 
达 因子 之 间 的 关系 ， (3) 在 首次 迁 代 计算 时 ,如 何 初 。 了 的 组 合 均 是 通过 不 同 的 运算 方式 实现 。 本 文 认为 ， 
始 化 这 些 因子 。 针对 问题 1， 本 文 涉及 了 一 种 循环 神 这 些 指数 平滑 模型 有 具有 很 强 的 可 解释 性 ， 可 以 通过 三 
经 网 络 , 解决 闪 代 计算 问题 ,针对 问题 2, 在 每 个 子 单 。 ”种 因子 对 数据 的 特征 有 直观 认识 。 然 而 ， 每 个 因子 的 
元 中 ,通过 多 层 感知 机 网 络 实现 因子 之 间 的 关系 表达 。 。 计算 公式 均 有 权重 系数 (比如 , a,B,y》。 在 使 用 时 ， 
同时 ， 也 设计 了 初始 化 网 络 实现 因子 的 初始 化 。 在 实 。 每 种 公式 均 需 人 工 设置 权重 实现 预测 效率 ， 所 以 灵活 


验 中 ， 通 过 对 真实 负荷 数据 的 预测 ， 验 证 了 本 文 模型 性 差 、 泛 化 能 力 不 强 。 此 外 ， 因 子 之 间 的 运算 关系 ， 


预测 效果 ， 而 且 比 原始 的 指数 平滑 模型 效果 更 好 。 通过 加 法 或 乘法 难以 表达 其 复杂 的 非 线性 关系 。 因 此 ， 
本 文通 过 引入 神经 网 络 实现 因子 之 间 复 杂 非 线性 关系 

1 指数 平滑 的 表达 ， 提 出 了 一 种 新 的 神经 网 络 计算 模型 ， 称 为 
指数 平滑 (Exponential Smoothing, 简称 ES) 起 源 DeepES 模型 。 模 型 的 总 体 框架 如 图 1 所 示 。 模 型 由 初 


于 Robert G. Brown 在 二 战 期 间 为 美国 海军 写 的 工作 始 化 模块 ， DeepES 单元 和 预测 模块 这 三 部 分 组 成 。 下 
报告 文章 09.Charles C. Holt 独立 于 Robert G. Brown， 面 对 每 个 模块 作 详细 介绍 。 

开发 了 一 种 类 似 的 方法 来 平滑 加 性 趋势 的 指数 ， 以 及 

一 种 完全 不 同 的 方法 来 平滑 季节 数据 。Winters 在 1960 
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图 1 模型 的 总 体 框架 


Fig. 1 Framework of model 
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图 2 InitNet 网 络 结构 
Fig.2 Structure of InitNet 


2.1 初 始 化 模块 


对 于 因子 初始 化 方法 ， 本 文 的 设计 思路 为 ， 记 输 
入 序列 为 {Xi1,X2,…,Xn}， 其 长 度 为 n。 取 输入 序列 的 前 
个 值 ， 记 为 {Xi1,X2,…,X}， 计 算 该 序列 的 均值 、 方 差 
和 水 平 比率 ， 三 个 指标 的 计算 公式 如 下 : 


1 
Xmean= K E =] Xi (5) 
1 
Xvar= K DE (Xi-Xnoan) (6) 
_ NXmean 
b py Xi (7) 


得 到 Xiiean，Xvar，Xp 三 个 指标 之 后 , 通过 初始 化 
网 络 InitNet 得 到 初始 化 因子 的 取 值 Xinir。InitNet 网 络 
的 设计 如 图 2 所 示 。 得 到 Xinit 之 后 ， 则 初始 化 三 个 天 
子 : 


So= [x init»* .Xi (8) 
T= _Xptl (9) 


init 


IO=XP… (10) 


Inlt 


其 中 ，So 取 Xinit 的 前 pl 个 值 进行 初始 化 ， To 取 Xinit 
的 第 p+1 个 值 进行 初始 化 ，m 取 Xinz 的 第 p+2 个 值 
初始 化 。 


2.2DeepES 单元 


每 个 迭代 步骤 的 执行 单元 是 DeepES 单元 〈 如 
3 所 示 ) ， 下 面 详细 介绍 DeepES 单元 中 的 执行 流 
程 ， 记 当前 执行 步 为 t: 
QD 计算 ttl 时 刻 的 平滑 因子 Tu1， 公 式 如 下 : 
1b1=TempNet(concat(X, S)) (11) 
Impz=TempNet(concat(I5T )) (12) 
It=Inl+Ip? (13) 
其 中 ，concat() 表 示 两 个 向 量 的 拼接 操作 ，TempNet 
为 其 中 的 计算 网 络 ， 网 络 设计 如 图 4 所 示 。 
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图 3 DeepES 单元 网 络 结构 
Fig.3 Structure of DeepES cell 
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图 4 TempNet 网 络 结构 
Fig.4 Structure of TempNet 
包 计 算 tl 时 刻 的 趋势 因子 Tal， 公 式 如 下 : 
Tp1=TempNet(concat(T,I a) (14) 
Tai=Tpi+T (15) 
其 中 , concat(-) 表 示 两 个 向 量 的 拼接 操作 ,TempNet 为 
其 中 的 计算 网 络 ， 网 络 设计 与 平滑 因子 Tu 中 的 计算 


网 络 一 致 ; 
加 计算 tl 时 刻 的 趋势 因子 Su1， 公 式 如 下 : 
Sbi=TempNet(concat(X5I )) (16) 
Str1=Sp1+S: (17) 
，concat(') 表 示 两 个 向 量 的 拼接 操作 ，TempNet 为 
的 计算 网 络 ， 网 络 设计 与 平滑 因子 Ti 中 的 计算 
网 络 一 致 ; 


2.3 ”预测 模块 


基于 最 后 一 个 DeepES 单元 输出 的 三 个 因子 , 即 
Slast、Tiast、Tist， 计算 预测 值 ?， 计 算 公 式 为 : 

Y=PreNet(concat(Str1, Tr,l, 1)) (18) 
，Cconcat(") 表 示 两 个 癌 量 的 拼接 操作 ，PreNet 为 
的 预测 网 络 ， 如 图 5 所 示 . 
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3 实验 
实验 数据 :文章 利用 美国 能 源 


恩 团 的 公开 数据 
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输入 J 
图 5 PreNet 网 络 结构 图 
Fig.S Structure of PreNet. 
表 3 趋势 对 比 表 
Tab. 3 Trend comparison 
True ES DeepES 

1-15 下 降 1-8 下 降 1-5 下 降 
15-31 上 升 8-23 卡 逢 5-21 上 升 
31-40 下 降 23-37 下 降 21-39 下 降 
40-45 上 升 ”37-42 上 升 ”39-44 ”上升 
45-50 下 降 42-45 下 降 44-47 下 降 
50-61 上 天 45-57 上 上 玉 47-51 上 升 
57-61 下 降 51-61 下 降 


(4) GBRT， 即 渐进 梯度 回归 树 (Gradient Boost 
Regression Tree) ， 可 处 理 不 同类 型 的 数据 ， 具 有 
很 强 的 预测 能 力 。 该 方法 也 是 时 序数 据 预 测 经 常 
采用 的 对 比方 法 。 实 验 中 ， 利 用 sklearn 提供 的 


对 模型 实证 分 析 。 为 了 验证 DeepES 的 有 效 性 ， 从 预 

测 精度 、 可 解释 性 和 深度 非 线性 拟 合 预测 有 效 性 等 三 

个 方面 对 DeepES 进行 了 分 析 论 证 。 
对 比 算法 :为 验证 DeepES 的 预测 性 能 ， 本 文选 取 

的 对 比 模型 如 下 : 

(1) ARIMA, 该 方法 是 经 典 的 时 间 序 列 方法 , 在 负荷 
预测 任务 中 也 常 作为 对 比 算法 。 实 验 中 ， 采 用 模 

型 参数 为 (0,0,1)。 

(2) LSTM, 即 长 短期 记忆 网 络 , 是 循环 神经 网 络 的 经 

网 络 ， 能 够 挖掘 序列 数据 的 非 线性 时 间 依 赖 关 
系 。 实 验 中 ， 采 用 2 层 LSTM， 输 出 维度 为 64。 

(3) BP, 即 反 向 传播 (Back Propagation) 神 经 网 络 ， 是 
经 典 的 神经 网 络 ， 在 时 序 预测 和 负荷 预测 任务 中 
有 广泛 应 用 。 实 验 中 ， 隐 藏 层 维度 为 32， 输 出 维 
度 64。 
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图 6 原始 均值 序列 
Fig.6 Original mean sequence. 
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图 7 DeepES 预测 序列 
Fig. 7 Forecast Sequence of DeepES 
函数 实现 ， 主要 参数 为 估计 器 数量 300， 最 大 深 
度 3。 
(5) Transformer， 该 模型 最 近 很 多 学 者 将 其 运用 到 了 
序列 数据 预测 、 目 标 检 测 等 领域 ， 均 取得 了 不 错 


ol 


的 效果 。 实验 中 , 利用 pytorch 提供 的 transformer (8) Three ES， 简 单 指数 平滑 、 线 性 指数 平滑 与 季节 


函数 实现 ， 主 要 参数 为 编码 层 和 解码 层 的 输入 维 间 数 三 者 结合 的 三 次 指数 平滑 方法 ， 针 对 有 季节 
度 为 64， 隐 藏 层 维度 64， 层 数 为 1。 性 表现 的 时 间 序 列 预测 09。 

(6) OneES， 简 单 指数 平滑 ， 近 期 序列 对 当前 数据 影 对 比 指标 :本 文采 用 RMSE 与 MAPE 评估 模型 的 
响 较 大 ， 各 期 数据 的 权重 根据 时 间 间 隔 增 大 指数 预测 性 能 ， 计 算 方 法 如 下 : 
衰减 |"。 MAPE= 2 xi | 

(7) TwoES，Holt 两 参数 指数 平滑 ， 对 含有 线性 趋势 (19) 

RMSE= | 2 (x.-¢) 

的 序列 设置 固定 的 线性 趋势 ， 进 行 修正 预测 19。 nl ii 


By 


为 说 明 深度 非 线 性 因子 的 有 效 性 ， 实 验 进 行 非 前 性 、 预测 性 , 例如 原始 负 蓓 1-15 下 降 , 15-31 上 升 ， 
线性 因子 的 合理 性 分 析 。 为 更 具有 说 服 性 ， 实 验 选取 ES 表现 1-8 下 降 ，8-23 上 升 ，DeepES 表现 为 1-5 下 
长 度 为 60 的 归 一 化 负荷 序列 ， 如 图 6。 分 别 利 用 ES 降 , 5-21 上 升 。 趋 势 预测 对 未 来 数值 拟 合 有 重要 作用 ， 
和 DeepES 计算 平滑 因子 、 季 节 因子 、 趋 势 因 子 ， 因此 预测 效果 较 好 。 
图 7 为 DeepES 预测 序列 。 ER 

在 图 8 中 ， 给 出 了 本 文 DeepBS 模型 与 指数 平滑 31 负 全 预测 精度 对 比 

模型 (ES) 之 间 的 因子 对 比 。 可 以 看 出 ， 趋 势 因 子 与 为 验证 DeepES 对 负荷 预测 的 先进 性 ， 选 取现 阶段 性 
DeepES 趋势 因子 整体 趋势 一 致 ， 趋 势 对 比如 表 2， 不 能 较 优 的 序列 预测 算法 作为 对 比 算法 ， 如 表 2 所 示 。 
同 的 是 , DeepES 利用 非 线 性 拟 合 趋势 特征 , 更 具有 超 从 对 比 结果 来 看 ， 本 文 模型 的 预测 效果 最 优 。 
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现 负 荷 序 列 预 测 ， 因 子 预测 效果 优 于 ES。 如 图 9 所 


ES 平滑 因子 与 真实 序列 趋势 和 数据 点 值 域 ， 而 。 示 ， 两 种 模型 的 每 一 步 预 测 绝对 误差 对 比 。 

DeepES 平滑 因子 与 ES 存在 较 大 差异 ， 由 于 DeepES 轩 、 

利用 线性 变化 和 非 线性 激活 函数 捕 提 序列 前 后 数据 之 。 ”3 “解释 性 验证 

间 的 非 线性 关系 。ES 季节 因子 有 明显 周期 性 , 且 周 其 利用 DeepES 中 利用 多 层 感知 机 对 各 种 因子 进行 

固定 , DeepES 季节 因子 周期 与 幅 值 不 断 变化 , 对 不 同 。” 非 线性 组 合 ， 自 适应 学 习 组 合 参数 。 相 对 于 RNNs 与 

序列 的 季节 因子 拟 合 能 力 更 强 。 MLP 等 网 络 ，DeepES 更 具 可 解释 性 ， 实 验 分 别 将 各 
因为 DeepES 利用 神经 网 络 的 非 线性 拟 合 能 力 分 “种 因子 及 组 合 利用 DeepES 网 络 进行 负荷 预测 ， 结 果 


别 拟 合 平滑 、 季 节 、 趋 势 三 种 因子 ， 进 一 步 利 用 多 层 如 图 -10 所 示 。I 代表 季节 因子 ，S 代表 平滑 因子 , T 
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代表 趋势 因子 ，TS 代表 趋势 因子 与 平滑 因子 组 合 


代表 季节 因子 与 平滑 因子 组 合 、IT 代表 季节 因子 
势 因子 在 组 合 、ITS 代表 三 种 因子 组 合 
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DeepES 预测 效果 优越 的 可 解释 性 。 图 11 中 表示 60 


步 预测 的 RMSE 与 MAPE，ITS 预测 性 能 最 优 ， 
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模型 DeepES， 在 实际 负荷 序列 数据 中 验证 了 优越 的 


预测 性 能 ， 说 明了 DeepES 依据 经 
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Fig. 9 Comparison of absolute error 
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图 10 因子 预测 效果 对 比 


Fig. 10 Comparison results using three factors 
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图 11 三 种 因子 预测 绝对 误差 对 比 


Fig. 11 Comparison of absolute error three factors 
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